首页> 外文OA文献 >To Normalize, or Not to Normalize: The Impact of Normalization on Part-of-Speech Tagging
【2h】

To Normalize, or Not to Normalize: The Impact of Normalization on Part-of-Speech Tagging

机译:规范化或不规范化:规范化对规范化的影响   词性标注

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Does normalization help Part-of-Speech (POS) tagging accuracy on noisy,non-canonical data? To the best of our knowledge, little is known on the actualimpact of normalization in a real-world scenario, where gold error detection isnot available. We investigate the effect of automatic normalization on POStagging of tweets. We also compare normalization to strategies that leveragelarge amounts of unlabeled data kept in its raw form. Our results show thatnormalization helps, but does not add consistently beyond just word embeddinglayer initialization. The latter approach yields a tagging model that iscompetitive with a Twitter state-of-the-art tagger.
机译:归一化是否有助于对嘈杂的非规范数据进行词性(POS)标记准确性?据我们所知,在没有黄金错误检测的现实情况下,对归一化的实际影响了解甚少。我们研究了自动归一化对推文POS标签的影响。我们还将规范化与利用原始形式保存的大量未标记数据的策略进行比较。我们的结果表明,规范化可以提供帮助,但不能仅在单词嵌入层初始化之外添加一致的内容。后一种方法产生了与Twitter最新的标记器竞争的标记模型。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号